2025-03-05 09:13:04.AIbase.
Vivo reorganiza y crea nuevo departamento de IA, trasladando el entrenamiento de modelos grandes al lado del cliente
2025-02-27 10:45:10.AIbase.
DeepSeek lanza la actualización de estrategia paralela en su cuarto día de código abierto: DualPipe y EPLB impulsan la revolución del entrenamiento de modelos grandes
2025-02-24 09:25:15.AIbase.
Moonlight y UCLA presentan un nuevo modelo Mixture-of-Expert para mejorar la eficiencia del entrenamiento de modelos de lenguaje
2025-02-10 10:31:26.AIbase.
Tencent solicita patente para un "método de entrenamiento de modelos de lenguaje extenso", mejorando la capacidad de generalización y la precisión del modelo
2025-02-08 17:52:43.AIbase.
Tencent publica una nueva patente para el entrenamiento de modelos de lenguaje extenso, mejorando la generalización y la precisión del modelo
2025-01-07 10:17:11.AIbase.
Google acelera el entrenamiento de modelos de IA grandes con modelos pequeños, mejorando la eficiencia en un 28%
2025-01-06 10:24:02.AIbase.
El investigador chino-estadounidense Jeffrey Wang de Harvard se une a OpenAI para centrarse en el preentrenamiento y la inferencia de modelos
2025-01-02 11:53:32.AIbase.
Shanghái lanza una nueva flota de vehículos de recolección de datos para acelerar el entrenamiento de modelos de conducción autónoma
2024-12-26 11:55:13.AIbase.
¡Avance revolucionario en el entrenamiento de IA! El nuevo marco CoMERA reduce drásticamente los costos y el consumo de recursos del entrenamiento de modelos
2024-12-13 10:19:49.AIbase.
¡Google abre el acceso a su TPU Trillium de vanguardia! Mayor rendimiento y eficiencia sin precedentes en el entrenamiento de modelos de IA
2024-11-27 16:51:47.AIbase.
Optimizador "Buddha" C-AdamW: ¡Una línea de código acelera el entrenamiento de modelos grandes un 147%!
2024-11-13 13:56:05.AIbase.
¡Sorprendente! ¿La alta precisión en el entrenamiento de modelos de lenguaje no siempre es mejor? ¿7-8 bits son la clave?
2024-10-21 11:51:02.AIbase.
ByteDance responde a los rumores de "prácticas dañinas de un becario en el entrenamiento de modelos": No afectó a proyectos comerciales oficiales
2024-10-18 14:14:32.AIbase.
Nueva política de X sobre uso compartido de datos genera controversia: permite por defecto el entrenamiento de modelos de IA por terceros, generando preocupaciones sobre la privacidad del usuario
2024-10-15 14:03:45.AIbase.
Volcan Engine lanza PixelDance, una solución de preprocesamiento de video para entrenamiento de modelos grandes
2024-10-10 11:52:35.AIbase.
Writer reduce los costos de entrenamiento de modelos de IA con datos sintéticos, desafiando a los gigantes de la industria
2024-10-08 13:45:50.AIbase.
El nacimiento de 5,7 billones de tokens de alta calidad: el "tesoro misterioso" TxT360 para el entrenamiento de modelos de lenguaje extenso
2024-08-22 08:40:49.AIbase.
PaddlePaddle 3.0 introduce la paralelización automática unificada estática y dinámica, simplificando el desarrollo del entrenamiento de modelos grandes
2024-08-16 09:26:00.AIbase.
Nvidia revoluciona el entrenamiento de modelos: ¡nuevo modelo con ahorro de potencia de cálculo del 180%!
2024-07-08 14:27:07.AIbase.